home *** CD-ROM | disk | FTP | other *** search
/ Internet Info 1994 March / Internet Info CD-ROM (Walnut Creek) (March 1994).iso / inet / ien / ien-141 < prev    next >
Text File  |  1988-12-01  |  28KB  |  828 lines

  1.      IEN 141
  2.      INDRA Note 897
  3.      11th April 1980
  4.  
  5.  
  6.  
  7.  
  8.  
  9.  
  10.  
  11.  
  12.  
  13.  
  14.                       Message System Issues
  15.  
  16.  
  17.  
  18.                           C. J. Bennett
  19.  
  20.  
  21.  
  22.  
  23.  
  24.           ABSTRACT:  This  INDRA  Note  discusses   the
  25.           design  choices for the message server system
  26.           to  be  built  at  UCL.   Particular   issues
  27.           considered include: the nature of the UK user
  28.           community; the nature of the message  service
  29.           to  be  offered  on  the  server; the message
  30.           formats and transfer protocols  to  be  used;
  31.           addressing;  interworking  with  the  ARPANET
  32.           community; and  the  design  of  the  message
  33.           management system on the message server.
  34.  
  35.  
  36.  
  37.  
  38.  
  39.  
  40.  
  41.  
  42.  
  43.  
  44.  
  45.  
  46.  
  47.  
  48.  
  49.  
  50.  
  51.  
  52.  
  53.  
  54.  
  55.  
  56.  
  57.  
  58.  
  59.  
  60.  
  61.  
  62.  
  63.  
  64.  
  65.  
  66.  
  67.                         Table of Contents
  68.  
  69.  
  70.  
  71.  
  72.   1. Introduction...........................................1
  73.  
  74.  
  75.   2. The User Community.....................................1
  76.  
  77.  
  78.   3. Message Movement.......................................2
  79.  
  80.      3.1 Message Format.....................................2
  81.         3.1.1 Message Format Staging........................3
  82.      3.2 Message Protocol...................................3
  83.      3.3 Message Transport..................................4
  84.         3.3.1 FTP Staging...................................5
  85.      3.4 Addressing.........................................5
  86.      3.5 Status Reporting...................................8
  87.  
  88.   4. Message Server Design..................................8
  89.  
  90.      4.1 User Interface.....................................8
  91.      4.2 Message Management.................................10
  92.  
  93.   5. Conclusions............................................12
  94.  
  95.  
  96.  
  97.  
  98.  
  99.  
  100.  
  101.  
  102.  
  103.  
  104.  
  105.  
  106.  
  107.  
  108.  
  109.  
  110.  
  111.  
  112.  
  113.  
  114.  
  115.  
  116.  
  117.  
  118.  
  119.  
  120.  
  121.  
  122.      1. Introduction
  123.  
  124.        Electronic message services  have  historically  been
  125.      one  of  the most successful services to have developed
  126.      from the use  of  packet  switched  computer  networks.
  127.      However,  these  facilities  have not been available to
  128.      users of United Kingdom research data networks  in  the
  129.      past,  and  UK  users who wished to send mail to remote
  130.      sites were  required  to  obtain  mailboxes  on  remote
  131.      machines  in the United States, accessible via ARPANET.
  132.      With the development of public networks, in  particular
  133.      IPSS  and  PSS,  and  in  view  of the UKPO's policy of
  134.      requiring users to move to these  networks,  it  is  no
  135.      longer  economically  feasible to continue this mode of
  136.      usage.
  137.  
  138.        For these reasons  it  is  proposed  that  University
  139.      College  London  will  develop  a message server system
  140.      based  on  a  PDP-11/35  running  UNIX  and  accessible
  141.      initially to users through the DARPA Catenet, and later
  142.      through PSS. This server would allow users to  exchange
  143.      messages  with  other  users on the same site, users of
  144.      ARPANET mail systems, and eventually users of other  UK
  145.      and  US message servers.  The aim of this INDRA note is
  146.      to identify the design constraints on this  system  and
  147.      to suggest approaches that may be taken to meet them.
  148.  
  149.  
  150.      2. The User Community
  151.  
  152.        Five major groups of users can be identified who  can
  153.      be  expected  to  interact  with  such a service in the
  154.      short term.  These are:
  155.  
  156.       (i)    Current  users  of  the  ARPANET  mail  system,
  157.              especially  UK  users who have (until recently)
  158.              had dialin access through the TIP. The  message
  159.              server  would  become the prime mail server for
  160.              this group. US users of ARPANET systems must be
  161.              able to send messages to this site.  This group
  162.              will require messages  formatted  according  to
  163.              the  rules specified in RFC 733 (as modified by
  164.              actual practice).
  165.  
  166.       (ii)   Users of the DARPA Catenet, who will  be  using
  167.              at  least  three  formats  for  intersite mail:
  168.              those of RFC 733; those of  the  Internet  Mail
  169.              Protocol  as defined in IEN 85; and the private
  170.              formats being developed by RSRE.
  171.  
  172.       (iii)  Users who wish to exchange messages between the
  173.              UCL  server  and other servers which may become
  174.              available  through   PSS.   This   group   will
  175.              initially require only PSS access to the server
  176.  
  177. Bennett                                                  [Page 1]
  178.  
  179. INDRA Note 897, IEN 141                     Message System Issues
  180.  
  181.  
  182.  
  183.  
  184.              and will exchanges messages locally, but in the
  185.              longer  term  it  can be anticipated that other
  186.              mail servers will emerge on PSS.
  187.  
  188.       (iv)   Users who wish to  exchange  messages  with  US
  189.              message  servers  available through Telenet and
  190.              IPSS. In particular,  such  traffic  may  arise
  191.              through the US EDUNET project.
  192.  
  193.       (v)    UCL users who will  exchange  messages  through
  194.              the  UCL  ring,  and  who will wish to exchange
  195.              messages with users in one or more of the other
  196.              three categories.
  197.  
  198.  
  199.  
  200.      3. Message Movement
  201.  
  202.        This section is concerned with  the  questions  which
  203.      affect  the  movement  of  messages between the message
  204.      server and other message sites.  Four  major  questions
  205.      must be considered: choice of message format; choice of
  206.      transport mechanism; mail protocol; and addressing.
  207.  
  208.  
  209.      3.1 Message Format
  210.  
  211.        The message  format  may  be  based  on  one  of  the
  212.      following choices:
  213.  
  214.       (i)    ARPANET Format (RFC 733)
  215.  
  216.       (ii)   Internet Mail Format
  217.  
  218.       (iii)  RSRE Mail Format
  219.  
  220.       (iv)   Other format not currently in use  amongst  the
  221.              user  community,  such  as those that may arise
  222.              through the work  of  IFIP  TC6.5,  or  through
  223.              Telenet and EDUNET.
  224.  
  225.  
  226.        Of these choices,  only  the  first  is  feasible  at
  227.      present.  It  is  that which is most widely used at the
  228.      moment,  as  it  provides  the  current  ARPANET   mail
  229.      service, and the internal UCL Unix mail service, and it
  230.      is intended that it shall be  used  for  initial  DARPA
  231.      Catenet  mail.  The  DARPA Internet Mail format is very
  232.      experimental, and although it  is  expected  to  remain
  233.      stable for the time being no experience has been gained
  234.      with it. Much the same  comment  applies  to  the  RSRE
  235.  
  236. Bennett                                                  [Page 2]
  237.  
  238. INDRA Note 897, IEN 141                     Message System Issues
  239.  
  240.  
  241.  
  242.  
  243.      system. The fourth choice involves either obtaining  an
  244.      existing commercial system such as COMET, or devising a
  245.      new format from scratch. Both these possibilities would
  246.      result  in  considerable  delay,  and a UCL home-brewed
  247.      format would be unlikely to be any  more  satisfactory,
  248.      and  would  be  much less acceptable to the users, than
  249.      other alternatives.
  250.  
  251.        As it may be anticipated that the server will have to
  252.      interwork  eventually  with other formats, notably that
  253.      of RSRE and whatever emerges amongst the EDUNET  group,
  254.      the  development  of  other  formats  should be closely
  255.      tracked. It is expected that conversion will eventually
  256.      take  place through the use of a common Internet Format
  257.      such as that being  developed  in  the  DARPA  Internet
  258.      scheme.
  259.  
  260.  
  261.      3.1.1 Message Format Staging
  262.  
  263.        One result of this is that users who will  eventually
  264.      require  a  different format for messages for their own
  265.      server - initially, RSRE in particular - will require a
  266.      conversion  between  the  two. It is expected that this
  267.      will take place at the UCL message  server.   As  noted
  268.      above,  it  is  to  be hoped that conversions will take
  269.      place through a common intermediary format.
  270.  
  271.        An important longterm question in this regard is  how
  272.      widely   the   UCL   message   server  system  will  be
  273.      distributed in the UK. If  other  message  servers  are
  274.      built along the same lines, then the format chosen will
  275.      become a __ _____ UK standard, at least  among  the  UK
  276.      research community.
  277.  
  278.  
  279.      3.2 Message Protocol
  280.  
  281.        The current ARPANET message protocol is essentially a
  282.      trivial   extension   to  the  ARPANET  file  transfer,
  283.      obtained through the  MAIL  option.  This  causes  each
  284.      message to be sent as a separate file to be appended to
  285.      the message file of an individual user  at  that  site.
  286.      Given  future use of IPSS and PSS this is an uneconomic
  287.      option. There are two reasons for this.
  288.  
  289.       (i)    Demultiplexing for a message  which  is  to  be
  290.              copied to several users at the same site occurs
  291.              at  the  sender,  not  the  receiver.   Thus  a
  292.              message  for N users at site X is transferred N
  293.              times, even though it is identical. If  mailers
  294.  
  295. Bennett                                                  [Page 3]
  296.  
  297. INDRA Note 897, IEN 141                     Message System Issues
  298.  
  299.  
  300.  
  301.  
  302.              were capable of  parsing  the  message  headers
  303.              properly, the message need only be sent once.
  304.  
  305.       (ii)   For each message transferred  a  separate  data
  306.              connection  is  set  up.  Thus  a  queue  of  N
  307.              messages for M sites (M < N) will require N + M
  308.              calls   to   be  made.  If  the  messages  were
  309.              mailbagged by site, only 2M calls need be made.
  310.              (Note  that  if FTP control and data were mixed
  311.              on the same call, as in the NIFTP (see  below),
  312.              these figures reduce to N and M respectively).
  313.  
  314.  
  315.        Both  these  changes  have  some  impact  on  message
  316.      format.  The  first  requires,  as  a minimum, that all
  317.      recipients of a message at a given site be  visible  in
  318.      the To: and Cc: fields - that is, it is not possible if
  319.      the mailing list facility is used in its current  form.
  320.      In  such  cases,  the sender must provide the list, and
  321.      the receiver must recognise that this  list  should  be
  322.      suppressed  or  separated from the users' copies. It is
  323.      to be hoped that the Internet group  will  accept  this
  324.      proposal  as a minimum change to be made for use in the
  325.      Catenet, and that similar procedures will be set up  by
  326.      other groups.
  327.  
  328.        Mailbagging requires that  different  messages  in  a
  329.      file   transferred  must  be  clearly  delimited.  This
  330.      requires a mailbag structure to be  defined  -  at  the
  331.      very  least,  by defining a standard message separator.
  332.      However,  it  does   not   require   restructuring   of
  333.      individual  messages.  This  is  a  much more important
  334.      change than the first, and as the saving is  likely  to
  335.      be  less,  it is proposed here that it should await the
  336.      results of experiments with the Internet Mail Protocol.
  337.  
  338.  
  339.      3.3 Message Transport
  340.  
  341.        There are two  major  choices  to  be  made  for  the
  342.      message  transport service, namely the TCP FTP, derived
  343.      from the ARPANET FTP, and the NI FTP.  It  is  expected
  344.      that  the  first  will  be  used  for  mail  within the
  345.      Catenet, using the same MAIL option as used within  the
  346.      ARPANET. As has been seen above, however, this protocol
  347.      is unsuited to our needs because it is  uneconomic.  It
  348.      may   be   retained   initially,  as  it  gives  direct
  349.      compatibility with other Catenet sites.
  350.  
  351.  
  352.  
  353.  
  354. Bennett                                                  [Page 4]
  355.  
  356. INDRA Note 897, IEN 141                     Message System Issues
  357.  
  358.  
  359.  
  360.  
  361.        In the slightly longer term, the NI FTP is  the  more
  362.      attractive   option.  The  reasons  for  this  are  its
  363.      independence of specific  transport  services  and  the
  364.      fact  that  it  will  be  widely adopted in the UK. UCL
  365.      already has implementations on its research Unix and at
  366.      ISIE  (though  these will have to be changed to reflect
  367.      the final specification); an implementation at RSRE  is
  368.      planned;  and future mail servers in the UK will prefer
  369.      to use it. The fact that many of these will  run  above
  370.      X25  networks  while  Catenet  sites  will  use  TCP is
  371.      immaterial; the  necessary  transport-level  conversion
  372.      will  be  handled  by  the  UCL Protocol Convertor. The
  373.      existing ARPANET FTP is demonstrably NCP-specific,  and
  374.      the  TCP  version  of  this  will  at  the  minimum  be
  375.      Catenet-specific in its use of Telnet.
  376.  
  377.  
  378.      3.3.1 FTP Staging
  379.  
  380.        An important consequence of this is that FTP  staging
  381.      will be required, for three reasons.
  382.  
  383.       (i)    It will be necessary to stage messages into and
  384.              out  of the ARPANET. This applies regardless of
  385.              the FTP used, as ARPANET mail is restricted  to
  386.              use of the ARPANET FTP.
  387.  
  388.       (ii)   It will be necessary to stage messages  between
  389.              mailers  in  the  Catenet using the TCP FTP and
  390.              those using the NI FTP. If UCL does  decide  to
  391.              use  the  TCP  FTP,  this  decision  is  merely
  392.              postponed until a UK community emerges based on
  393.              the NI FTP.
  394.  
  395.       (iii)  It  may  eventually  be  necessary   to   stage
  396.              messages   between   UCL   and   Telenet/Tymnet
  397.              servers, even if they adopt a common format, if
  398.              a different transport mechanism is used.
  399.  
  400.      It is proposed here that experiments with the first two
  401.      stagings  be performed at ISIE, or some other TOPS20 on
  402.      the ARPANET which has all three systems. In  its  final
  403.      form,  the  staging  system  would  consist of a daemon
  404.      which would process the mail file at a special  account
  405.      and  forward  messages  to  the appropriate sites.  The
  406.      structure of such a system is shown in Figure 1.
  407.  
  408.  
  409.      3.4 Addressing
  410.  
  411.        Only four message  sites  in  the  UK  are  initially
  412.  
  413. Bennett                                                  [Page 5]
  414.  
  415. INDRA Note 897, IEN 141                     Message System Issues
  416.  
  417.  
  418.  
  419.  
  420.  
  421.  
  422.  
  423.  
  424.  
  425.  
  426.  
  427.  
  428.  
  429.  
  430.  
  431.  
  432.  
  433.  
  434.  
  435.  
  436.  
  437.  
  438.  
  439.  
  440.  
  441.  
  442.  
  443.  
  444.  
  445.  
  446.  
  447.  
  448.  
  449.  
  450.  
  451.  
  452.  
  453.  
  454.  
  455.  
  456.  
  457.  
  458.                  Figure 1: Staging Daemon System
  459.  
  460.  
  461.  
  462.      expected  to  be  heavily  involved  in   the   system.
  463.      Initially,  development  will  be  in  the  UCL message
  464.      server itself (UCL-MUnix), while at a later  stage  the
  465.      UCL  teaching and research machines (UCL-TUnix and UCL-
  466.      RUnix), and at least one machine at  RSRE  will  become
  467.      involved.  While  other message servers may emerge at a
  468.      later date, it is not expected that  this  will  happen
  469.      rapidly.  Staging  to Catenet and ARPANET sites will be
  470.      through ISIE; the problem of staging to  Telenet/Tymnet
  471.  
  472. Bennett                                                  [Page 6]
  473.  
  474. INDRA Note 897, IEN 141                     Message System Issues
  475.  
  476.  
  477.  
  478.  
  479.      sites must be considered if and when it arises.
  480.  
  481.        The UK sites should be able to exchange mail directly
  482.      through  the  use  of addresses of the form 'user@site'
  483.      (e.g.  Ruth@UCL-TUnix).   This  format  could  be  used
  484.      throughout  the  mailing  address  space,  although  it
  485.      involves the message sites not  under  UCL  control  to
  486.      make  special  modifications  to their mailers. Thus an
  487.      ARPANET  mailer  presented  with   a   return   address
  488.      'Ruth@UCL-TUnix'  would  have  to  recognise  that this
  489.      should be sent to ISIE; the ISIE mailer would  have  to
  490.      recognise  that  the message should be added to the UCL
  491.      daemon's mailbox and the UCL daemon would then  forward
  492.      the message to UCL-TUnix.
  493.  
  494.        Two  other  alternatives  are  source   routing   and
  495.      hierarchical  addressing.  A  source routed form of the
  496.      address might be identical in appearance to the ARPANET
  497.      (by  making  'UCL' a synonym for ISIE, in much the same
  498.      way  the  'UDel-EE'  is  a  synonym  for  'Rand-Unix'),
  499.      although for parsing purposes it would be preferable to
  500.      rearrange  it:  (Ruth-(TUnix@(UCL))).  Local   messages
  501.      would  then  appear  as: Ruth-TUnix. An ARPANET address
  502.      would appear to a message server user in  a  form  such
  503.      as: Kirstein-ISI@ISIE. Staging message servers would be
  504.      required to parse the address into intermediate  forms.
  505.      Further,  the  terminal  staging server for the catenet
  506.      and  for  ARPANET  would  be   required   to   suppress
  507.      intermediate  fields. Thus the UCL daemon at ISIE would
  508.      have to transform all addresses of the form:  Kirstein-
  509.      ISI@ISIE to Kirstein@ISI and back again for traffic in
  510.      the reverse direction. Source routing is  the  favoured
  511.      solution of the University of Delaware's MMDF group.
  512.  
  513.        Hierarchical  addressing  is  actually  the  official
  514.      ARPANET  standard  as described in RFC 733, although it
  515.      is not implemented. It is also the solution favoured in
  516.      Postel's  Internet  system. Under this scheme UCL would
  517.      refer  to  a  widely-known   addressing   domain,   and
  518.      addresses  would  take  the form: Kirstein-ISI@ARPA and
  519.      Ruth-TUnix@UCL. In practice, since only  two  hops  and
  520.      only  one  staging point are involved the two forms are
  521.      virtually synonymous - which is  a  good  argument  for
  522.      postponing  a  real decision until we see an addressing
  523.      hierarchy actually emerging! The  differences  will  be
  524.      seen  when an RSRE server becomes active. In this case,
  525.      an ARPANET site has the choice of the following forms:
  526.  
  527.           Bryan@NSide               (global)
  528.           Bryan-NSide@PPSN          (hierarchical)
  529.           Bryan-NSide-MUnix@ISIE    (source routing)
  530.  
  531. Bennett                                                  [Page 7]
  532.  
  533. INDRA Note 897, IEN 141                     Message System Issues
  534.  
  535.  
  536.  
  537.  
  538.        Note that in any form changes of the type  above  are
  539.      required   to   ARPANET   mailers.   With   global  and
  540.      hierarchical  addressing,  ARPANET   tables   must   be
  541.      modified  to recognise mail servers (global address) or
  542.      mail address spaces (hierarchical  address).   This  is
  543.      not  required  with  source routing.  The mailer at the
  544.      staging site must additionally recognise  that  account
  545.      names  taking  a certain format should automatically be
  546.      accepted and routed to the  UCL  mail  daemon  at  that
  547.      site. Both solutions therefore require some structuring
  548.      of the address. In the examples above, a  hyphen  ('-')
  549.      has  been  used as a component separator. In fact, this
  550.      is probably a bad choice. Two possibilities are:
  551.  
  552.       (i)    Use of some other separator, such as %.
  553.  
  554.       (ii)   Use of the comment fields allowed by  the  mail
  555.              protocol.
  556.  
  557.      The second choice has the convenient side  effect  that
  558.      the  account  checking procedure need not be changed at
  559.      the staging site, as  addresses  may  then  look  like:
  560.      UCLfor   a   source-routed
  561.      format). However not all message preparation facilities
  562.      will include comment fields (e.g. 'answer' under MSG).
  563.  
  564.        Since this note was first drafted  my  attention  has
  565.      been  drawn  to  RFC754  (Out-of-Net Host Addresses for
  566.      Mail  by  J.  Postel).   This   note   considers   four
  567.      solutions:  three  are variants on the global solution,
  568.      and the fourth involves name structuring. Postel's note
  569.      favours  a structured name solution. This is compatible
  570.      with  either  a   source   routed   or   hierarchically
  571.      structured solution.
  572.  
  573.  
  574.      3.5 Status Reporting
  575.  
  576.        Finally in this section there is the issue of  status
  577.      reporting.   Currently,  most ARPA-type message systems
  578.      give an  immediate  report,  with  possibly  a  mailer-
  579.      generated  message if there is some subsequent failure.
  580.      For staged or mailbagged messages an  immediate  report
  581.      of  success  can only imply success at the first stage.
  582.      Thus it is important that staging daemons which  cannot
  583.      successfully  deliver  a  message  must  be prepared to
  584.      generate messages indicating why failure occurred. This
  585.      can  be  done  simply  through  the  use of the current
  586.      message generation mechanism.
  587.  
  588.  
  589.  
  590. Bennett                                                  [Page 8]
  591.  
  592. INDRA Note 897, IEN 141                     Message System Issues
  593.  
  594.  
  595.  
  596.  
  597.      4. Message Server Design
  598.  
  599.      4.1 User Interface
  600.  
  601.        The primary service  which  must  be  provided  is  a
  602.      reliable,  efficient  and  cheap  method of sending and
  603.      processing text messages  exchanged  amongst  the  user
  604.      community.  It  is not intended to provide a multimedia
  605.      service, although this is an important research goal of
  606.      the  program.  Within  this  constraint,  a user of the
  607.      message server must be able to:
  608.  
  609.       (i)    Prepare messages.
  610.  
  611.       (ii)   Send messages to remote users.
  612.  
  613.       (iii)  Receive messages from remote users.
  614.  
  615.       (iv)   Read messages.
  616.  
  617.       (v)    Be assured that messages are safely stored  and
  618.              are recoverable in the event of system failure.
  619.  
  620.       (vi)   Be able to obtain adequate online help  on  the
  621.              use of the server.
  622.  
  623.      In addition it is desirable that the user be able to:
  624.  
  625.       (i)    Prepare message files which  may  not  be  sent
  626.              immediately.
  627.  
  628.       (ii)   Archive and dearchive messages.
  629.  
  630.       (iii)  Manipulate messages in file structures  of  his
  631.              own creation.
  632.  
  633.       (iv)   Answer and forward messages.
  634.  
  635.       (v)    Obtain hardcopy listings.
  636.  
  637.       (vi)   Maintain mailing lists.
  638.  
  639.       (vii)  Annotate messages.
  640.  
  641.  
  642.        This list is clearly not exhaustive, and the aims  of
  643.      the user interface should be continually reevaluated in
  644.      the light of user experience,  development  experience,
  645.      and  the  recommendations of other message groups, such
  646.      as IFIP TC6.5.  Nor does it imply any evaluation of the
  647.      difficulty  of implementation: answering and forwarding
  648.  
  649. Bennett                                                  [Page 9]
  650.  
  651. INDRA Note 897, IEN 141                     Message System Issues
  652.  
  653.  
  654.  
  655.  
  656.      messages  should  be  comparatively  trivial;  while  a
  657.      satisfactory remote hardcopy listing service is a major
  658.      problem.
  659.  
  660.        Following the general approach taken in this note, it
  661.      is  proposed that MSG be used at least initially as the
  662.      basis of the user interface in the message server.  The
  663.      user  would enter MSG automatically as his login shell.
  664.      It is expected that the repertoire of commands will  be
  665.      changed and extended in order to provide the full range
  666.      of services listed above (e.g. for the  maintenance  of
  667.      mailing  lists).  This  may  require  the single-letter
  668.      command interface to be modified. It is  also  expected
  669.      that  the  character-at-a-time interface and the use of
  670.      TV editors would have to be altered to fit the needs of
  671.      users  accessing  the  system  via XXX terminals, which
  672.      favour line-oriented commands and editors. These issues
  673.      will be reexamined in the light of experience gained.
  674.  
  675.  
  676.      4.2 Message Management
  677.  
  678.        An important issue is  the  internal  design  of  the
  679.      message  server. The current system of personal mailbox
  680.      files each containing a copy of all messages is complex
  681.      and wasteful in a Unix system solely devoted to message
  682.      handling. It is proposed here that database  structures
  683.      be examined in which only one copy of a message is kept
  684.      in a central directory, and  that  the  user's  current
  685.      mail  file,  and any other mail files he keeps, consist
  686.      solely of descriptors pointing to the  message  and  to
  687.      other   cross-referencing   descriptors  which  may  be
  688.      needed. The structure of the system is shown in  Figure
  689.      2.
  690.  
  691.        The details  of  the  descriptor  structure  are  not
  692.      considered in this note. However, a number of important
  693.      issues arise. The fundamental question is:  should  all
  694.      messages be kept in a single file, or each message in a
  695.      separate  file?  The  answer   chosen   has   important
  696.      implications  for the limits on the size of the system,
  697.      the method of updating the system, methods of accessing
  698.      messages, and many other issues.
  699.  
  700.        In the second method, messages may be  found  rapidly
  701.      by  filename,  and  garbage  collection is considerably
  702.      simplified through the  use  of  Unix  file  management
  703.      facilities,  but  on  average  256  bytes  (half a disc
  704.      block) will be wasted per message. Further, at most  an
  705.      entire  file  system  of 64K blocks can be allocated to
  706.      message  service,  although  this  is  not  a   serious
  707.  
  708. Bennett                                                 [Page 10]
  709.  
  710. INDRA Note 897, IEN 141                     Message System Issues
  711.  
  712.  
  713.  
  714.  
  715.  
  716.  
  717.  
  718.  
  719.  
  720.  
  721.  
  722.  
  723.  
  724.  
  725.  
  726.  
  727.  
  728.  
  729.  
  730.  
  731.  
  732.  
  733.  
  734.  
  735.  
  736.  
  737.  
  738.  
  739.  
  740.  
  741.  
  742.  
  743.  
  744.  
  745.  
  746.  
  747.  
  748.  
  749.  
  750.  
  751.  
  752.  
  753.              Figure 2: Message Management Structure
  754.  
  755.  
  756.  
  757.      restriction. Assuming that most messages will be small,
  758.      of  the  order  of 2K characters, the file system would
  759.      allow something less than 16K messages, wasting some 4K
  760.      bytes  of  space. Thus a more serious limitation is the
  761.      number of inodes (file descriptors)  allocated  to  the
  762.      system,  which  is  currently  about 2^13 - allowing 8K
  763.      files. Increasing this to 2^14  is  not  difficult  and
  764.      will allow 16K files, of which a significant proportion
  765.      would be for user descriptor information.
  766.  
  767. Bennett                                                 [Page 11]
  768.  
  769. INDRA Note 897, IEN 141                     Message System Issues
  770.  
  771.  
  772.  
  773.  
  774.        The first method allows more efficient use  of  space
  775.      and  places  a much looser restriction on the number of
  776.      messages that may be retained,  but  requires  building
  777.      searching and garbage collection facilities parallel to
  778.      Unix's. In order  to  use  these,  moreover,  either  a
  779.      complex  file  structure  must  be defined, or a master
  780.      descriptor file retained.
  781.  
  782.        Pending further investigation, the second  choice  is
  783.      favoured  at this stage. The fact that only one copy of
  784.      a message need be kept  should  help  to  minimise  the
  785.      effects  of  the  restrictions.  Ensuring this may be a
  786.      problem, especially if multiple copies of a message are
  787.      received.  Hence  an important aspect of the system may
  788.      be to examine incoming messages and attempt  to  detect
  789.      duplicates of existing messages.
  790.  
  791.  
  792.      5. Conclusions
  793.  
  794.        The message system discussed here is  centred  around
  795.      text  messages  based largely on ARPANET-style formats,
  796.      at least  initially.  Nevertheless  there  are  several
  797.      important  issues  which  must  be resolved in order to
  798.      bring up a workable system. These issues include:
  799.  
  800.       (i)    Economic use of transfer and storage resources.
  801.  
  802.       (ii)   The structure  of  UCL-style  mail  daemons  at
  803.              staging site(s).
  804.  
  805.       (iii)  The  modification  of  other  mail  servers  to
  806.              handle UCL mail.
  807.  
  808.       (iv)   Basic addressing style.
  809.  
  810.       (v)    Detailed user interface.
  811.  
  812.       (vi)   Message management issues.
  813.  
  814.      This note has indicated some lines of approach to these
  815.      problems.  They  will  be  examined  in  more detail in
  816.      future notes, prior to the commencement of actual  work
  817.      on  the  system  later  this  year.  It  is  clear that
  818.      satisfactory   progress   requires   cooperation    and
  819.      discussion   with  other  parties,  notably  the  DARPA
  820.      Catenet group and groups using various  public  carrier
  821.      services.  While  the  projects  of the former are more
  822.      advanced at this point, it is expected that the  latter
  823.      groups  will  become increasingly important in the long
  824.      term.
  825.  
  826. Bennett                                                 [Page 12]
  827.  
  828.